課程資訊
課程名稱
統計與機器學習
Statistical and Machine Learning 
開課學期
110-2 
授課對象
共同教育中心  統計碩士學位學程  
授課教師
王彥雯 
課號
EPM7012 
課程識別碼
849 M0960 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期三2,3,4(9:10~12:10) 
上課地點
公衛211 
備註
生醫資訊與生物統計學領域選修課程之一。
限本系所學生(含輔系、雙修生)
總人數上限:30人
外系人數限制:2人 
 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程將介紹常見的統計學習方法及相關理論,範圍將涵蓋監督式學習(supervised learning)、regularized regression、ensemble learning等,並搭配R或Python的操作,引入實際問題的處理與分析,培養學生從資料中了解問題,並擷取有用的資訊以解決實際問題的能力。 

課程目標
本課程將介紹常見的統計與機器學習方法及其理論,同時搭配實例分析與程式撰寫,期望學生修習完後能具備分析資料及正確解讀分析結果之能力。 
課程要求
修課學生必須修過統計學與迴歸分析。 
預期每週課後學習時數
 
Office Hours
另約時間 備註: 助教:李宜芸 (r10849052@ntu.edu.tw) 
指定閱讀
1. James, G., Witten, D., Hastie, T., and Tibshirani, R. (2021). An Introduction to Statistical Learning with Applications in R. 2nd edition. Springer.
2. Hastie, T., Tibshirani, R. and Friedman, J. (2016). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd edition. Springer. 
參考書目
1. Abu-Mostafa, Y. S., Magdon-Ismail, M. and Lin, H.-T. (2012). Learning from Data: a Short Course. AMLBook.
2. Alpaydin, E. (2014). Introduction to Machine Learning, 3rd edition. MIT Press Ltd.
3. Summa, M. G., Bottou, L., Goldfarb, B., Murtagh, F., Pardoux, C. and Touati, M. (2012). Statistical Learning and Data Science. Chapman and Hall/CRC.
4. Lantz, B. (2019). Machine Learning with R : Expert techniques for predictive modeling, 3rd edition. Packt Publishing.
5. Wickham, H. and Grolemund, G. (2017). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media.
6. Muller, A. C. and Guido, S. (2016). Introduction to Machine Learning with Python: A Guide for Data Scientists. O'Reilly Media.
7. 塚本邦尊、山田典一 、大澤文孝著,莊永裕譯 (2020)。東京大學資料科學家養成全書:使用 Python 動手學習資料分析。臉譜出版。 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
平時表現、課堂參與、作業練習 
35% 
 
2. 
文獻閱讀報告 
30% 
針對給定的主題,學生必須搜尋相關文獻,並針對文獻內容進行上台報告。 
3. 
期末口頭報告 
15% 
修課學生必須利用上課所學,完成一個實務分析報告,在期末時口頭發表分析成果。 
4. 
期末書面報告(海報) 
20% 
修課學生需要製作英文海報展現實務分析之成果,並參與公衛學院舉辦的課程海報交流活動。 
 
課程進度
週次
日期
單元主題
第1週
2/16  Introduction: what is statistical and machine learning? 
第2週
2/23  Overview of supervised learning 
第3週
3/2  Regression: linear regression & regularized regression -- ridge regression, LASSO, elastic-net 
第4週
3/9  Classification: logistic regression, k-nearest neighbors 
第5週
3/16  Classification: Bayesian decision theory, discriminant analysis 
第6週
3/23  Classification: support vector machines & Regression: Support vector regression 
第7週
3/30  Classification: support vector machines & Regression: Support vector regression 
第8週
4/6  Tree-based methods -- regression trees, classification trees, random forests 
第9週
4/13  專題演講:國立高雄師範大學 數學系 葉倚任教授 
第10週
4/20  Model assessment: evaluation, cross-validation, bootstrap 
第11週
4/27  Ensemble learning: boosting, bagging, stacking, cascading 
第12週
5/4  Basic concepts of neural networks 
第13週
5/11  文獻閱讀報告(I):Deep learning 
第14週
5/18  文獻閱讀報告(II):Imbalanced classification 
第15週
5/25  期末口頭報告 
第16週
6/1  期末口頭報告